Prédiction des buzz sur Twitter
نویسندگان
چکیده
The prediction of bursty events on the internet is a challenging task. Difficulties are due to the diversity of information sources, the size of the internet, dynamics of popularity, user behaviors... On the other hand, Twitter is a structured and limited space. In this paper, we present a bursty event prediction method applied to the Twitter plateform. The proposed method uses tweet contents to predict the retweet rate. Prediction system extracts 3 types of features, related respectively to popularity, saliance and expressivity. These descriptors constitute the input features of a multilayer perceptron that predicts the retweet rate. Our experiments are conducted on a test corpus composed by about 30,000 tweets. On this test set, the proposed system detects more than 72% of the tweets that have been forwarded at least 60 times. MOTS-CLÉS : Buzz, audience, twitter, modèles thématiques, Allocation Latente de Dirichlet
منابع مشابه
Utilisation de règles d'association pour la prédiction de valeurs manquantes
Résumé. Le traitement des valeurs manquantes est une problématique importante dans le domaine des entrepôts de données. Plusieurs solutions ont été proposées pour la prédiction de valeurs manquantes, présentant les caractéristiques suivantes : (i) la prédiction traite soit des valeurs continues soit des valeurs discrètes, et (ii) la prédiction est approximative (soit elle est associée à une pro...
متن کاملRelaxations de la régression logistique : modèles pour l'apprentissage sur une sous-population et la prédiction sur une autre
Résumé. Habituellement en analyse discriminante on a à prédire le groupe d’appartenance à partir des variables de description ou covariables. La règle de prédiction est élaborée en utilisant un échantillon d’apprentissage soumis aux mêmes conditions externes que les individus à prédire. Dans ce travail, on s’intéresse à la prédiction d’individus d’une certaine sous-population utilisant un échan...
متن کاملPrédiction de liens temporels en intégrant les informations de contenu et de structure
RÉSUMÉ. Dans cet article nous traitons le problème de la prédiction de liens temporels, qui consiste à prédire l’apparition des nouveaux liens dans des graphes de données dynamiques. Cette tâche apparaît dans les applications telles que la recommandation ou l’analyse des réseaux sociaux. La plupart des approches de prédiction de liens temporels se basent uniquement sur la structure topologique ...
متن کاملEtude comparée des performances de SVM multi-classes en prédiction de la structure secondaire des protéines
Résumé. Les SVM bi-classes, introduites en bioinformatique à la fin des années 90, font aujourd’hui référence pour de nombreux problèmes de traitement de séquences biologiques. Les SVM multi-classes, de conception plus récente, sont progressivement appliquées à ces problèmes, singulièrement en biologie structurale prédictive. Dans cet article, nous proposons une étude comparée des performances ...
متن کامل